import scrapy

# Spider 是所有爬虫类的父类
class FirstSpiderSpider(scrapy.Spider):
    # 爬虫文件的名称：就是爬虫源文件的一个唯一标识
    name = "first_spider"
    # 允许的域名：用来限定 start_urls 列表中哪些 url 可以进行请求发送。
    allowed_domains = ["www.baidu.com"]
    # 起始点 url 列表：该列表中存放的 url 会被 scrapy 自动进行请求的发送。
    start_urls = ["https://www.baidu.com", "https://www.sougou.com"]

    # 用作于数据解析：response 参数表示的就是请求成功后，对应的响应数据
    def parse(self, response):
        print('===========')
        print(response)


